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(57) Abstract 

The invention relates to novel tumour suppressor genes of the p53 family, to polypeptides which code them and to their use. It 
preferably relates to nucleic acids which code KET, especially those of rats, humans and mice. 

(57) Zusammenfassung 

Die Erfindung betrifft neue Tumorsuppressorgene der p53-Familie, Polypeptide die sic kodieren, sowie ihre Verwendung, Bevorzugt 
betrifft sie KET-kodierende Nuklemsauren, insbesondere der Ratte, des Menschen und der Maus. 
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Tumorsuppressorgene der p53-Familie 

Die Erfindung betrifft neue Tumorsuppressorgene der p53-Familie t Polypeptide, 
die sie kodieren sowie ihre Verwendung. Bevorzugt betrifft sie KET-kodierende 
Nukleinsauren, insbesondere der Ratte, des Menschen und der Maus. 

Gene, die in der Tumorigenese eine maftgebliche Rolle spielen, kdnnen aufgrund 
ibrer funktionellen Wirkweise grob klassifiziert werden. Fuhrt eine Gain-of- 
function-Mutation zu einem Allel, das auf die Tumorigenese aktivierend wirkt, so 
wird das betroffene Gen als Oncogen bezeichnet. 1st eine Loss-of-function- 
Mutation auf beiden Allele notig (inaktivierend), um tumorigene Veranderungen 
moglich werden zu lassen, spricht man von einem Tumorsuppressor-Gen. Das 
prominenteste und meist untersuchte Tumorsuppressor-Gen kodiert fur den 
nuklearen Transkriptionsfaktor p53 (uber 2000 Medline Eintrage im vergangenen 
Jahr; NCBI-Datenbank) mit der Hauptfunktion in der Kontrolle des Zell-Zyklus' 
und der Apoptose (Levine 1997). p53 liegt in humanen Tumoren zu uber 50 % 
mutiert vor (Hollstein et al. 1991), vererbte p53 Mutationen fuhren zu einer 
erhohten Tumorhaufigkeit bei den Tragern des defekten Allels (Evans und 
Lozano 1997). Derzeit existieren vier p53-knock-out Mauslinien, die von 
mehreren Arbeitsgruppen unabhangig voneinander hergestellt wurden und als 
Tiermodelle fur den Menschen dienen. p53-defiziente Tiere (Genotyp: +/- und -/-) 
zeigen schon im fruhen Alter eine vermehrte Tumorrate (Donehower et al. 1992, 
Harvey et al. 1993b). Die Embryo- und Organogenese verlauft jedoch im 
allgemeinen unauffallig, so dali p53 defiziente Tiere nicht von ihren +/+ 
Wildtypgeschwistern zu unterscheiden sind (Donehower et al. 1992). Allerdings 
zeigen einige p53 -/- Embryonen am Tag 13.5 der Embryogenese einen 
charakteristischen Defekt in der Morphologie des Kopfbereiches, eine 
Exencephalie, bei der der Verschluli des Neuralrohres in Vorder und Mittelhim 
nicht erfolgt. Diese MiBbildung tritt bei 16 % der homozygot-defizienten CV 129 
Embryonen auf, wahrend nur 8 % von CV129 X C57BU6- p53 -/- 
Hybridembryonen betroffen sind. Interessanterweise variiert auch die 
Tumorinzidenz im CV129 Hintergrund und CV129 X C57BU6 Hybridhintergrund. 
Tumoren entwickeln sich generell schneller in CV 129 Mausen als in CV 129 X 
C57BU6-Hybriden; zusatzlich kommt es in CV 129 Tieren vermehrt zu 
Teratomen (Donehower et al. 1995, Harvey et al. 1993a). Solche Unterschiede 
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konnen nur durch die jeweils unterschiedliche Konstitution des genetischen 
Hintergrundes erklart werden. Das zeigt im unterschiedlichen genetischen 
Hintergrund das Vorliegen differenzierter Kompensationseffizienz gegenuber dem 
p53-Verlust und die Existenz verwandter Gen-Produkte, welche die Funktion von 
p53 wahrend der Embyogenese und Cancerogenese verrichten. 

Der Erfindung lag deshalb die Aufgabe zugrunde, entsprechende Gene 
bereitzustellen, die fur Proteine kodieren, welche bei der Kontrolle des Zell-Zyklus 
und der Apoptose eine Rolle spielen. 

Die Erfindung basiert auf der Erkenntnis, da(i das Protein KET mit so 
bemerkenswerter Homoiogie in seiner Aminosauresequenz zup53 gefunden 
wurde, dali es mit p53 in einer p53-Familie zusammengefafct werden kann. Wie 
p53 besitzt KET eine Transaktivierung-, eine DNA-Bindungs- und eine 
Oligomerisierungsdomane. Der hochste Grad an Homoiogie ist in der DNA- 
Bindungs-Domane zu finden. Er betragt zwischen KET und p53 75%. Die 
Isolierung der kodierenden cDNAs erfolgte aus der Ratte (SEQ ID No. 1). 

ErfindungsgemafJ wurde die menschliche KET cDNA (SEQ ID No. 2) kloniert; ein 
Alignment der abgeleiteten Aminosauresequenz (SEQ ID No 3) mit der aus Ratte 
und den Sequenzen von humanem p53 und p73 ist in Abb. 1 gezeigt. Die KET- 
Aminosaure-Sequenz aus der Ratte zeigt eine Homoiogie von 98 % zu der des 
Menschen. 

Es wurde eine chromosomale Lokalisation des Gens auf dem Chromosom 3q des 
Menschen und 16 der Maus (vgk Abb. 2 Genetische Kartierung) gefunden, 
woraus sich auf eine Funktion von KET als Tumorsuppressor ruckschliefcen lalit. 
Interessanterweise kartiert das Ke/-Gen der Maus in einen Bereich, der in fruhen 
Stadien der Pancreaskanzerogenese deletiert ist und vermutlich einen 
Suppressor der Angiogenese, Loh2 (Gensymbol: Loh2) t beinhaltet, fur den Ket 
somit einen Kandidaten darstellt 

Gemaii der Erfindung wurde festgestellt, dad das KET-Protein bei der 
Tumorsuppression beteiligt ist. Von speziellem Interesse waren vor allem solche 
Tumoren. in denen bisher keine Veranderungen des p53 Wildtypallels 
beschrieben wurden. Die chromosomale Lokalisation der verantwortlichen 
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Tumorsuppressorgene kann durch cytogenetische Analysen, die Loss of 
heterozygosity (LOH)-Bereiche identifizieren, vorausgesagt werden. Es wurde 
nachgewiesen, da& das KET/Ket-Gen bei Mensch oder Maus in solche LOH- 
Regionen kartiert. 

EffindungsgemafS erfolgte eine Kartierung des KET/Ket-Gens bei Mensch und 
Maus mit flankierenden Markern (Abb.2). Zur prazisen chromosomalen 
Lokalisation beim Menschen wurden Bestrahlungshybride (Radiation Hybrids; 
GeneBridge 4 Panel, Research Genetics) eingesetzt, die Kartierung bei der Maus 
erfolgte in einer M. musculus X M. spretus Ruckkreuzungsgeneration. Das Kef- 
Gen kartiert zwischen das Somatostatin-Gen und das Apolipoprotein D Gen auf 
Chr. 3q des Menschen. Dieselbe Genreihenfoige wurde auf Chr. 16 der Maus 
bestatigt. A (links) chromosomaler Abschnitt des humanen Chromosoms 3q mit 
der Position des KET-Locus; B (mitte) Position des Kef-Locus auf Chr. 16 der 
Maus. C (rechts) Ket-Haplotypen und Markergene auf Chr. 16. Jede Saule 
reprasentiert zwei Haplotypen von Chr. 16, die Anzahl der Backcross-lndividuen 
ist unten angegeben (obere Zahl: gefullte Quadrate/Rechtecke SEG/1 Allel; leere 
Quadrate/Rechtecke C57BL6J Allel; untere Zahl: das Gegenteil) 
Gensymbole: CKCN2/Clc2 - Chlorid-Channel 2; SST/Smst - Somatostatin; 
KET/Ket - p53 verwandtes Protein KET; APOD/Apod - Apolipoprotein D; 
GAP43/Gap43 - Wachstum beeinfluGendes Protein 43. 

Gegenstand der Erfindung sind deshalb die KET-Nukleinsauren, vorzugsweise 
KET-cDNA der Ratte, des Menschen und der Maus sowie deren Fragmente, 
Varianten und Mutationen, vorzugsweise die SEQ ID No.1 (KET-cDNAder Ratte) 
und die SEQ ID No. 2 (humane KET-cDNA). 

Fragmente, Varianten und Mutationen sind durch Basenaustausche 
gekennzeichnet. Weiterhin konnen auch alle T durch U ersetzt sein 
(Ribonukleinsaure) . 

Ferner sind Gegenstand der Erfindung die Polypeptide fur die die cDNAs 
kodieren, vorzugsweise SEQ ID No. 3, und deren an einer oder mehreren Stellen 
durch Austausch von Aminosauren geanderte Strukturen. 
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Die Herstellung erfolgt nach an sich bekannten Verfahren, wie z. B. durch 
Isolierung unci Sequenzierung aus cDNA-Bibliotheken. 

Desweiteren betrifft die Erfindung die Verwendung der KET-Nukleinsauren und 
Polypeptide als Ausgangsbasis zur Entwicklung spezifischer und wirkungsvoller 
Cancerostatika. Sie werden zum Aufbau von Genen und Vektoren eingesetzt, die 
die Basis fur die Entwicklung dieser pharmazeutisch relevanten Substanzen 
darstellen. 

Aufierdem werden sie zur Entwicklung diagnostischer Kits eingesetzt, so z.B. zur 
Vorhersage eines Krebsrisikos. Gegenstand sind demzufolge auch diagnostische 
Testkits. 

Weiterhin erfolgte die Charaktehsierung von genomischen Ket-Klonen des 
Menschen und der Maus durch die differentielle Darstellung von intron- 
umspannenden PCR-Fragmenten. Diese PCR-Tests wurden auch fur die 
Identifizierung von Kef-positiven BACs (Bacterial artificial chromosome) in einer 
genomischen BAC-Bibliothek (Genome Systems Inc) verwendet. Diese BACs 
enthalten DNA aus dem CV 129/J Maussiamm, so dafJ Subfragmente des BAC- 
Klones direkt zur Konstruktion des KeMargeting-Vektors eingesetzt werden. Auf 
den bisher identifizierten BACs befanden sich auch die ersten S'-Exons. Aus der 
full-length KET-cDNA Sequenz des Menschen und der Ratte wurden 
Primersequenzen abgeleitet, die zu Maus Exon 1 spezifischen PCR-Tests 
fuhren. 

Daruber hinaus wurden Kef-defiziente Mause hergestellt. 

Die Herstellung von Mausen, die Nullallele des Ke/-Gens tragen, erforderte vier 
aufeinanderfolgende Prozesse: 

• Isolierung und Charakterisierung eines geeigneten Abschnittes des Zielgenes. 

• Klonierung eines Targeting-Vektors, in dem der offene Leserahmen des 
Zielgenes durch die Integration eines Selektionsmarkers (vollstandige 
Transkriptionseinheit fur das Neomycin-Resistenz-Gen) zerstort ist. 

• Homologe Integration des Rekombinationskonstruktes in das Genom von 
embryonalen Stammzellen und anschlieBende Selektion auf die Antibiotika- 
Resistenz. 
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• Injektion von ESCs in Blastocysten (oder Kokultur mit Morulae) und 
anschlieftender Uterustransfer. 

Gegenstand sind auch Targeting-Vektoren. In einer Ausfiihrungsvariante wurde 
der bereits vorliegende BAC nach Verdau mit geeigneten 
Restriktionsendonukleasen in pBluescript oder pUC subkloniert (optimale Grofle 
der Subklone 5-10 kb). Ober weitere Restriktionskartierung und STS-Mapping (Sequence 
Tagged Sites) mittels PCR und/oder Southern blotting wurde ein Subklon-Kontig 
erstetlt, das als eine Feinkartierung des S'-Genbereichs angesehen werden kann. 
Hierzu wurde die cDNA-lnformation aus Mensch und Ratte verwendel Generell 
kann die Unterbrechung des offenen Leserahmens an zwei Stellen erfolgen: Es 
wurde in einem Fall die ersten translatierten Exons und im anderen die gesamte 
putative DNA-Bindungs-Domane ausgeschaltet. Um die gewebsspezifische 
Expression von Ket wahrend der Embryo- und Organogenese in Chimaren und 
Kef-defizienten Mausen zu verfolgen, wurde zusatzlich eine G-Galactosidase- 
Kassette so einkioniert, daR sie der Kontrolle des Kef-Promoters unterliegt. 
Generell waren zwei Formen des gezielten Gentargeting moglich: Bei 
Verwendung eines Insertionsvektors integrierte der komplette Vektor (ein 
Crossover-Ereignis war erforderlich), bei dem gebrauchlicheren 
Replacementvektor integrierte lediglich ein Teil, der von der Wahl intragener 
Restriktionsschnittstellen abhangig war (zwei Crossover-Ereignisse erforderlich), 

Genausschaltung in embryonalen Stammzellen (ESCs) 

Wte schon oben aufgefuhrt, ist die verwendete genomische BAC-Bibliothek CV 
129-Ursprungs. Aus diesem Mausstamm wurden auch die meisten 
gebrauchlichen ESCs isoliert. Der Vorteil der Verwendung von isogenem Material 
liegt in der hoheren Wahrscheinlichkeit zur homoiogen Rekombination. ESCs 
wurden nach Transfektion (Elektroporation) durch G418-Selektion uberpruft. Im 
Falle des Replacement-Vektors wurde zusatzlich eine Vektor-interne 
Thymidinkinase-Kassette zur negativ-Selektion (Gancyclovir) bei nicht homologer 
Integration genutzt. 

Eine erfolgreiche homologe Rekombination wurde uber DNA-Analysen (Southern- 
Blot) gepruft. 

Durch die Injektion von so geanderten ESCs in Blastocysten wurden auch 
Embryonalchimaren hergestellt und diagnostiziert. 
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Fur die Blastocysteninjektion Oder Morula-Aggregation wurden nur genotypisierte 
ESCs verwendet Chimare Praimplantations-Embryonen wurden in die 
Uterushorner von scheinschwangeren Rezipientenmausen ubertragen. Chimaren 
wurden in Testverpaarungen auf eine erfolgte Keimbahntransmission von ESC- 
Abkommlingen uberpruft. F1/F2 Nachkommen von Chimaren, die das Ket Null- 
Allel entweder hetero- oder homozygot tragen, wurden mittels Southern-Blot- 
oder PCR-Analysen genotypisiert 

Weiterhin ist die Erfindung durch ein Beispiel und ein Sequenzprotokoll naher 
erlautert. 

Beispiel 

Gewinnung der humanen KET-cDNA (SEQ ID No. 2) 

Fur die Gewinnung von humaner KET-cDNA wurden 1 x 10 5 Klone einer 
menschlichen Skelettmuskel-cDNA-Bibliothek (Stratagene) mit Proben uberpruft, 
die einer Ratten-KET-cDNA entstammten (Schmale und Bamberger, 1997). Ein 
einziger positiver Klon, hu41m, wurde gewonnen und das Insert von 3226 bp 
wurde unter Verwendung vektorspezifischer und interner Primer - in zwei 
Richtungen sequenziert. Das Insert enthielt einen offenen Leserahmen von 1360 
bp, homolog zum N-Terminus der Ratten-KET-Sequenz, die Kodiersequenz war 
jedoch nach dem QQHQHLLQ-Motiv an Position 448 durch eine unbekannte 
Sequenz unterbrochen. Die Oberprufung von 6 x 10 5 Klonen einer menschlichen 
Keratinocyten-cDNA-Bibliothek (Clontech) mit einer Probe, die vom 3-Ende von 
hu41m stammte, ergab zwei ubereinandergreifende Klone, hu6k und hu10k, die 
mit einem Teil des cDNA-Klons hu41 identisch waren und die Sequenz zum 3'- 
Ende hin verlangerten. Urn 3 ( -Endsequenzen zu erhalten, wurde die EST- 
Datenbank mit dem nichttranslatierten 3'-Bereich des Ratten-KET-Klons 
durchforscht. Nach Feststellung mehrerer homologer EST-Klone wurden zwei 
davon (I.M.A.G.E. Consortium Klon ID 149663 und 137665) vollstandig 
sequenziert. Fur die Amplifikation und direkte Sequenzierung eines 1,2 Kb- 
Fragmentes aus der menschlichen Haut-cDNA wurden PCR-Primer gemaR dem 
3-Ende des cDNA-Klons hu10k und dem S'-Ende des EST-Klons 149663 
verwendet. Die vollstandige cDNA enthalt 4846 bp, einschlieGlich 27 bp des 
hochstwahrscheinlich verkurzten nichttranslatierten S'-Bereichs und 2776 bp des 
nichttranslatierten 3'-Bereichs . Um die benachbarte Anordnung der aus 
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verschiedenen Quellen gewonnenen Sequenzen zu demonstrieren, wurden 
PCR-Primer, die gemall der Translationsstart- und -stoppkodons positioniert 
waren, fur die Amplifikation der vollstandigen Proteinkodierungssequenzen des 
KET von menschlicher Haut-cDNA verwendet. Die cDNA enthalt einen offenen 
Leserahmen, der fur 680 Aminosauren kodiert (Abb. 1). Dem vermutlichen Start 
Methionin geht ein Translationsstoppkodon (nicht dargestellt) im Raster voran. 
Ein Vergleich der Aminosauresequenzen der KET von Menschen und Ratten 
zeigt eine 98 %-ige Identitat (Abb. 1). Diese beachtliche interspezifische 
Konservierung von KET-Proteinen erstreckt sich uber die gesamte Molekullange. 
Sie ist im Mittelteil, der den DNA-Bindebereich enthalt, sogar noch ausgepragter; 
248 Aminosauren sind vollig unverandert. Die KET-Proteine sind weitaus 
konservierter als die entsprechenden p53-Proteine vom Menschen und von 
Ratten, die zu insgesamt 79 % homolog sind. Lediglich im DNA-Bindebereich 
erreicht ihre Identitat 91 %. Menschliches p73 zeigt eine Identitat von insgesamt 
58 % mit menschlichem KET. Die Konservierung ist wiederum im DNA- 
Bindebereich mit einer Identitat von 86 % am hochsten. wahrend der N-terminale 
Bereich, mit Ausnahme des Transaktivierungsbereichs, am meisten abweicht. 
Aulier dem Transaktivierungs- und dem DNA-Bindebereich weisen p53, p73 und 
KET einen gut erhaltenen Oligomerisationsbereich gemeinsam auf. Es ist 
wahrscheinlich, daB die drei Proteine in der Lage sind, Mischoligomere zu bilden, 
die spezifische biologische Funktionen haben. 

Bei Proteinen, die aus funktionellen Grunden keine Veranderung tolerieren 
konnen, wie solche, die Mehrfachbindestellen aufweisen, sind 
Aminosauresequenzen im allgemeinen so gut erhalten, wie das bei KET vom 
Menschen und von Ratten zu beobachten ist. Diese Konservierung lafit 
vermuten, dafi KET ein evolutionares altes Gen sein kann, das wahrscheinlich 
bei der Entwicklung und Differenzierung hoherer wirbelloser Tiere und Wirbeltiere 
in die allgemeinen Grundfunktionen einbezogen wurde. p53 kann sich spater von 
seinem Vorlaufergen als Protein weiterentwickelt haben, das fur spezifische 
Funktionen wie die Oberwachung von Genomschaden verantwortlich ist. Der Umfang der 
genotoxischen Belastung hangt von physiologischen Faktoren und 
Umweltfaktoren ab, die, zumindest teilweise bei den verschiedenen Arten 
unterschiedlich sind. So kann die relative Vielgestaltigkeit von p53. im Vergleich 
zu KET, die artspezifischen Anforderungen an ein solches System widerspiegeln. 
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Fur das Kartierungsverfahren auf der Grundlage von PCR wurden STS vom 
Menschen (hKET8) und zwei KET STS von Mausen (muKET8 und muKET)) 
amplifiziert (s. Tab. 1 ). 

Die Primerpositionen wurden so definiert, daB Fragmente entstanden sind, die 
ein Intron, flankiert von Exonsequenzen, enthalten. Das ermoglichte die 
Identifizierung richtiger PCR-Fragmente durch einen Vergleich mit der bekannten 
KET-cDNA-Sequenz von Ratten. Speziell fur die Kartierung des Ket-Gens von 
Mausen haben wurden intronhaltige PCR-Fragmente gewahlt, urn nach einer 
Restriktion mit geeigneten Endonucleasen leicht nachweisbare Fragment- 
Langen-Polymorphismen zu erhalten. Die Exon-lntron-Grenzen wurden durch 
einen Vergleich der KET-Aminosaurensequenz mit der von p53 und p73 
(Schmale und Bamberger, 1997; Kaghad et al, 1997) abgeleitet. Die 
Exonsequenzen entsprachen der KET-Aminosaurensequenz des Menschen 
(Abb. 1) wie folgt: hKET9, Aminosaurereste 360-390; muKET8, Aminosaurereste 
360 - 400; muKET9, Aminosaurereste 383 - 438. PCRs wurden, wie bereits 
beschrieben (Lengeling et al, 1995), durchgefuhrt. Nukleotidsequenzen von 
Primern fur den Mit-Mikrosatellitenmarker Dl6Mit57 wurden aus der MIT- 
Mausgenomdatenbank gewonnen. Maussegregationsdaten wurden mit dem 
GENE-LINK Computerprogramm (Montagutelli, 1990) verarbeitet. hKET8, das 
Intron 8 umfalit, wurde mittels der GeneBridge 4 
Strahlungshybridkartierungspanels kartiert (Research Genetics, Huntsville, AL). 
Dieses Panel stellt 91 Strahlungshybridklone des gesamten Humangenoms dar. 
Das K£T-Gen wurde am Humanchromosom 3q27 zwischen den 
Mikrosatellitenmarkern D3S1580 und D3S1314 kartiert (Abb. 2A). Die 
wahrscheinlichste Genreihenfolge und -abstande waren D3S1580 - 2,2 cR - Wt- 
6145-7,1 cR - KET - 4,7 cR - VW1189-8,9 CR-D3S1314. Dieser Bereich ist 
von Somatostatin-, SST (O'Hara et al, 1988) und Apolipoprotein D, APOD 
(Warden et al, 1992) flankiert, Informationen uber die chromosomale 
Lokalisierung von SST und APOD und die Genreihenfolge wurden der 
Chromosomen 3-Karte entnommen (San Antonio Genome Center; 
http://genome.uthcsa.edu/Maps/frame.html). 

3q27 ist der mittlere Teil eines Bereich einer gut dokumentierten Syntenie zum 
Mauschromosom 16, der sich von CLCN2 nach GAP43, bzw. Clc2 nach Gap43 
im Mausgenom erstreckt (DeBry und Seldin, 1996; Lengeling et al, 1995). Urn 
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festzustellen, ob der Maus-Ket-Locus in den homologen Bereich fallt, erfolgte 
eine Kartierung des Ket-Gens unter Verwendung einer Interspeziesruckkreuzung 
der Maus (C57BL/6J wrl + xSEG/1 +/+)*Fi wr//+ x (C57BU6J wrt+), die 
ursprunglich fur die Kartierung des Wbb6/er-Gens etabliert wurde (Kaupmann et 
al t 1992). Dieses Interspeziesruckkreuzungspanel wurde fur uber 150 Loci 
charakterisiert, die uber alle Autosome und die X-Chromosomen verteilt waren. 
Es wurde eine verbesserte Karte des Chromosoms 16 fur die Kartierung des 
Chloridkanalgens Clc2 geschaffen (Lengeling et at. 1995). Beide Maus-KET- 
PCR-Fragmente lieferten informative Restriktionsfragmentlangenvarianten 
(RFLVs), die fur die Segregationsanalyse ven/vendet wurden. Das Fragment mit 
Intron 8 (muKET8) wurde mit Msp1 geschnitten, muKET9 mit Rsa1. KET wurde 
zwischen Smst und D16MH63 entdeckt mit Lodserves > 8 (Abb. 2B.C). Das 
Maushomologe des menschlichen Apolipoproteins D, Apod, der Genmarker an 
menschiichem Chr 3q eng verbunden distal zu KET, wurde im M. musculus x M. 
Spretus Ruckkreuzungspanel nicht kartiert, jedoch sind detaillierte 
Kartierungsdaten verfugbar (Reeves und Cabin, 1997; Warden et al, 1992; 
Reeves et al, 1997). Es wurde D16Mit 57 kartiert, das distal zu Apod (Reeves 
und Cabin, 1997) angeordnet ist und einen Polymorphismus von Fragmentlange 
zwischen dem M. musculus C57BU6J (111 bp) und M. spretus SEG/1 (135 bp) 
nutzt. Bei 50 Meiosen wurde keine Rekombination von Ket und D16MH57 
festgestellt. Auf der Ruckkreuzungstafel von M. musculus x M. spretus waren die 
wahrscheinlichsten Genreihenfolge und -abstande Cen - D16Mit87 - 3,9 ± 1,7 
CM - Smst D16MM02 - 4 ± 2,77 cM - Ket, D16Mit 57 - 14 ± 4,91 cM - 
D16MH63, 

Der Verlust des langen Arms von Chromosom 3 wird selten festgestellt (vgl. 
Chitayat et al, 1996). Die Symptome mit Eliminierungen 3q27-+qter 
unterscheiden sich erheblich und reichen nicht aus, urn ein spezifisches Syndrom 
abzuleiten. Wahrend in zwei Fallen ledigtich kleinere faziale Abnormitaten, 
Verzogerungen in der Entwicklung und Hypotonien berichtet wurden, zeigten 
andere ernsthafte, mehrfache kongenitale Abnormitaten, einschliefilich 
Anophtahlmie und Hirnathrophie. 

In einigen Humankrebsgeweben (z.B. osophagealem Krebs und squambse 
Karzinomen) wurden LOH-Bereiche an Chr 3 entdeckt, die 3q27 enthielten (Sato 
et al, 1994; Wang et al, 1996). Obwohl statistisch von Bedeutung, war ein Verlust 
von 3q, der im Vergleich zu anderen chromosomalen Abnormitaten mit einer 
reiativ geringen Haufigkeit auftrat, bei diesen Tumoren zu beobachten. 
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Vergleichende Kartierungsdaten zeigten Bereiche einer vollig erhaltenen 
Syntenie zwischen Chr 3q und den Mauschromosomen 3, 9 und 16 (vgl. DeBry 
und Seldin, 1996), wovon zwei die vorhergesagten Suppressorgene Loh1 und 
Loh2 beherbergen, die auf ausgepragten Stufen der Tumorentyvicklung in einem 
transgenen Mausmodell des Inselzellkarzinoms (Dietrich et at, 1994; Parangi et 
al, 1995; Shi et at, 1997) deletiert werden. Das Ket-Gen fallt in den gleichen LOH- 
Bereich mit Loh2 (LOH etwa 15 cM, 14-29 cM von Cen, fiankiert durch die 
Mikrosatellitenmarker D16MH35 und D16Mit39\ (vgL Parangi et al, 1995). Von 
Loh2 wird angenommen, daS es einen Suppressor der Angiogenese (Parangi et 
al, 1995) kodiert. Tatsachlich wurde gezeigt, daB das Protein p53 die 
Angiogenese in Fibroblasten indirekt hemmt durch die positive Regulierung der 
Thrombospondin-1 -Expression (Dameron et al t 1994). Daher ist Ket ein Kandidat 
fur Loh2 durch seine chromosomale Lokalisierung und durch seine putative 
Funktion. 

Tabelle 1 



PCR Primer fOr STS aus den KET/Ket Regionen 



STS 


Sequenz (5'->3') 


Grofle (bp) 


Temperieaing Referenz 


hKET8 


CAGAAAGCAGCAAGTTTCGGAC 
TG G ATGTC ATCTGGATAC C ATG 


750 


55°C 


muKET8 


CAGAAAGCAGCAAGTTTCGGAC 
AGCTCATCATCTGGGGATCTCC 


2,300 


65°C 


muKET9 


ACACGGAATCCAGATGACTTCC 
TGCTGCCTGTACGTTTCGATCG 


3.100 


65°C 


D16Mrt57 


AAAAAA I 1 1 IAAACCATGTGAATGT 
TGAAGTTTATTATGAGTTGAATCATGC 


111 
135° 


63°C MIT 



GroBe des Amplifizierungsproduktes mit C57BU6J DNA; B (SEG/1) 
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Patentanspriiche 

1. KET-kodierende Nukleinsauren, Fragmente, Varianten und Mutationen. 

2. KET-Nukleinsauren nach Anspruch 1, gekennzeichnet durch die KET-cDNA 
der Ratte mil der Sequenz SEQ ID No. 1 sowie deren Fragmente, Varianten 
und Mutationen. 

3. KET-Nukleinsauren nach Anspruch 1, gekennzeichnet durch die humane 
KET-cDNA mit der Sequenz SEQ ID No. 2 sowie deren Fragmente, Varianten 
und Mutationen. 

4. KET-Nukleinsauren nach einem der Anspruche 1 bis 3, dadurch 
gekennzeichnet, da(3 T durch U ausgetauscht ist. 

5. KET-Nukleinsauren nach einem der Anspruche 1 bis 4, dadurch 
gekennzeichnet, daft sie vollstandig komplementar ist 

6. Polypeptide, fur die KET-Nukleinsauren gemali einem der Anspruche 1 bis 5 
kodieren 

7. Polypeptide nach Anspruch 6 gekennzeichnet durch die SEQ ID No. 3 sowie 
deren an einer oder mehreren Stellen durch Austausch von Aminosauren 
geanderte Strukturen. 

8. Vektoren, die eine KET-Nukleinsaure oder fur KET-Polypeptide kodierende 
DNA nach einem der Anspruche 1 bis 5 enthalten. 

9. Wirtszellen, die die Vektoren gemafl Anspruch 8 enthalten. 

10. Verwendung von KET-Nukleinsaure oder Polypeptiden nach einem der 
Anspruche 1 bis 7 zum Nachweis von KET-Nukleinsauren in biologischen 
Proben. 

1 1 . Verwendung nach Anspruch 10, dadurch gekennzeichnet, dafS man eine 
biologische Probe mit mindestens einer Verbindung dieser Nukleinsauren, 
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vorzugsweise mit den Verbindungen der SEQ ID No. 1, SEQ ID No. 2 
und/oder SEQ ID No. 3, ggf. mit einem Tragermolekul nach an sich ublichen 
Methoden in Kontakt bringt und der Nachweis anhand des gebiideten 
Hybridisationskomplexes durch physikalische oder chemische Methoden 
erfolgt. 

12. Verwendung nach Anspruch 10 oder 11, dadurch gekennzeichnet, dad die 
Nukleinsaure DNA ist, die ggf. eine homozygotische Deletion enthalt. 

13. Verwendung nach Anspruch 10, dadurch gekennzeichnet, dafi die 
Nukleinsaure RNA ist. 

14. Verwendung nach einem der Anspruche 10 bis 13, dadurch gekennzeichnet, 
dad die Nukleinsaure markiert ist, vorzugsweise durch ein Radioisotop, eine 
bioiumineszente, eine chemilumineszente oder fluoreszente Verbindung, ein 
Metallchelat oder ein Enzym. 

15. Verwendung nach einem der Anspruche 10 bis 14, dadurch gekennzeichnet, 
dad die biologische Probe Tumorgewebe mit erfolgter Angiogenese des 
Menschen oder der Maus ist. 

16. Verwendung von KET-Nukleinsauren nach einem der Anspruche 1 bis 5 zum 
Nachweis der Gegenwart oder Abwesenheit des menschlichen Chromosoms 
3q27 oder dessen Fragmenten anhand des Hybridationsproduktes zwischen 
chromsomaler DNA und der KET-Nukleinsaure. 

17. Verwendung von KET-Nukleinsauren nach einem der Anspruche 1 bis 5 zum 
Nachweis der Gegenwart oder Abwesenheit des Mauschromosoms 16 oder 
dessen Fragmenten anhand des Hybridationsproduktes zwischen 
chromsomaler DNA und der KET-NukleinsSure. 

18. Testkit zum Nachweis oder Veranderungen von KET-Nukleinsauren 
enthaltend 

- mindestens eine KET-Nukleinsaure oder ein Polypeptid gemaB einem der 
Anspruche 1 bis 7 oder eine Hybridisationsprobe. 
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SEQUENZPB0T0KOLL 

(1) ALLGEMEINE INFORMATION: 
(i) ANMELDER: 

(A) NAME: Fraunhof er-Gesellschaf t zur Fdrderung der 

angewandten Forschung e.V. 

(B) STRASSE: Leonrodstr. 63 

(C) ORT: MUnchen 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: D-80636 

(ii) ANMELDETITEL: Tumor suppres so rgen der p53-Familie 
<iii) ANZAHL DER SEQUENZEN: 3 

<iv) COMPUTER- LESB ARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 
(C> BETRIEBSSYSTEM: PC-DOS /MS-DOS 

(D) SOFTWARE: Pacentln Release Ifl.O, Version #1.25 (EPA/ 



(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 4708 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : cDNS 



(xi) SEQUENZBESCHREIBOMG: SEQ ID NO: 1: 



TAAGTGAGTT 


CCTCAGCCCA 


GAGGTGTTCC 


AGCATATCTG 


GGATTTTCTG GAACAGCCTA 


60 


TATGCTCAGT 


ACAGCCCATC 


GACTTGAACT 


TTGTGGACGA ACCATCAGAA AATGGTGCAA 


120 


CAAACAAGAT 


TGAGATTAGC 


ATGGATTGTA 


TCCGCATGCA 


AGACTCAGAC CTCAGTGACC 


130 


CCATG TGGCC 


AC AG T ACACG 


AACCTGGGGC 


TCCTGAACGG 


CATGGACCAG CAGATTCAGA 


240 


ACGGCTCCTC 


ATCTACCAGC 


CCCTATAACA 


CAGACCATGC 


ACAGAACAGC GTGACGGCAC 


300 


CCTCGCCCTA 


TGCACAGCCC 


AG CTCAAC C T 


TCGATGCCCT 


TTCTCCATCC CCTGCCATTC 


360 


CCTCCAACAC 


AGATTACCCA 


GGCCCACACA 


GCTTCGATGT 


GTCCTTCCAG CAGTCAAGCA 


420 


CCGCCAAGTC 


AGCTACCTGG 


ACGTATTCCA 


CCGAACTGAA 


GAAACTCTAC TGCCAGATTG 


480 


CAAAGACCTG 


CCCCATCCAG 


ATCAAGGTGA 


TGACCCCACC 


CCCACAGGGC GCCGTCATTC 


540 


GTGCCATGCC 


TGTCTACAAG 


AAAGCCGAGC 


ATGTCACCGA 


GGTTGTGAAA CGATGTCCTA 


600 


ACCACGAGCT 


GAGCCGCGAG 


TTCAATGAGG 


GACAGATTGC 


CCCTCCCAGT CATCTGATTC 


660 
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GAGTAGAAGG 


GAACAGCCAT GCCCAGTATG 


TAGAAGATCC 


TATCACAGGA 


AGGCAGAGCG 


720 


TGCTGGTCCC 


TTATGAGCCA CCACAGGTTG 


GCACTGAATT 


C ACAAC AG TC 


CTGTACAATT 


780 




CAGCAGCTGT GTCGGAGGAA 


TGAACCGCCG 


TCCAATTTTA 


AT CAT CGT TA 


840 


p rnp m r~ C. A A A C 


CAGAGATGGG CAAGTCCTGG 


GCCGACGTTG 


CTTTGAGGCC 


CGGATCTGCG 


900 




AAGAGACCGG AAGGCCGATG 


AAGACAGCAT 


CAGAAAGCAG 


CAAGTATCAG 


960 


ACAGC Gt- AAA 


GAACGGCGAT GGTACGAAGC 


GCCCTTTCCG 


TCAGAATACC 


CACGGAATCC 


1020 


AGATGAt, lit 


CATCAAGAAA CGGAGATCCC 


CAGATGATGA 


GCTGCTGTAC 


CTACCAGTGA 


1080 


GAGGCCGIGA 


GACTTATGAA ATGCTGCTCA AGATCAAGGA 


GTCGCTCGAG 


CTCATGCAGT 


1140 


ATCTCCCTL.A 


GCACACGATC GAGACGTACA 


GGCAGCAGCA 


GCAGCAGCAG 


CACCAACACC 


1200 


TAC T TCAG AA 


ACAGACCTCG ATGCAGTCTC 


AGTCTTCATA 


CGG TAACAGC 


TCACCACCTC 


1260 


TGAACAAAAT 


GAACAGCATG AACAAGCTGC 


CGTCTGTGAG 


CCAGCTTATC 


AACCCACAGC 


1320 


AGC G CAACG C 


CCTGACTCCC ACCACCATGC 


CTGAGGC-CAT 


GGGAGCCAAC 


ATTCCTATGA 


1380 


TGGGCACTCA 


CATGCCAATG GCTGGAGACA 


TGAATGGACT 


CAGCCCCACC 


CAAGCTCTTC 


1440 


CTCCTCCACT 


CTCCATGCCC TCCACCTCCC 


ACTGCACCCC 


CCCACCTCCG 


TACCCAACAG 


1500 


AC T GCAG CAT 


TGTCAGTTTC TTAGCAAGGT 


TGGGCTGTTC 


ATCATGTCTG 


GACTATTTCA 


1560 


CGACCCAGGG 


GCTGACCACC ATCTATCAGA 


TTGAGCATTA 


CTCCATGGAT 


GATTTGGCAA 


1620 


G TC T GAAGAT 


CCCTGAGCAG TTCCGACATG 


CCATCTGGAA 


GGGGATCCTG 


GACCACAGGC 


1680 


AGCTGCATGA 


CTTCTCCTCA CCTCCGCATC 


TCCTGAGAAC 


CCCCAGTGGT 


GCCTCTACAG 


1740 


TCAGTGTGGG 


CTCCAGTGAG ACCCGTGGAG 


AACGTGTGAT 


TGATGCCGTG 


CGCTTTACTC 


1800 


TCCGCCAGAC 


CATCTCTTTC CCACCCCGTG 


ATGAGTGGAA 


CGATTTCAAC 


TTTGACATGG 


1960 


ATTCCCGTCG 


CAACAAGCAG CAGCGCATCA AAGAGGAAGG 


AGAATGAACG 


TCCGTCGCCG 


1920 


GGTTCTTCCT 


GTTTTCTTCC TCCTCCCAGC 


TCCCACAGGG 


CACGCCTGCT 


TGATCCTCAA 


1980 


AGCCTTCTCG 


CTAGCTCTCC TCCTCCTCCT 


TCTCAGTCTG 


t» I A 1L1 Annu 


fxc\ a cczc a c a a 


2040 


TTAAGAGGCT 


ACCTGTTACC TAAAGTCTGA 


CCTGTCACCT 


GATTCTGATC 


CTGGCTTTAA 


2100 


GCCTTCAATA 


CTCTTGCTTG CAAGATGCGT 


TGACATTGCT 


AGATAGACGT 


TAGCAGAGAA 


2160 


GCAGTGGGTC 


TCTCTAAGCA CTGGAGATCG 


CTCATTGACT 


TTTATAAAGC 


ATTTTCAGCC 


2220 


TTATAGTCTA 


AGACTATATA TATAAATATA 


TAAATATACA 


. ATATATATTT 


CGGGTGGGGG 


22S0 


TATTGAGTAT 


TGTTTAAATG TAATTTAATG 


GAAATCGAGT 


TGCACTTATC 


: AACCTTCTTT 


2340 


GGAATTTGCT 


TGTTTTGGTT GGCTGATCTG 


TACCCCTTTC 


TCAGGGGTAT 


' CATGTATGGT 


2400 
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GACAGATATT 


TAGAGTTGAA 


TGGTCTATGT 


GAGTAACAGT GATATATAGG 


TCCTCTCCTT 


2 4 oU 


TCTTTGGATG 


ATTGCCGTTT 


AGCACATCAA 


ACCTGTGGAT GCGTCCAGTC 


TGTTTACCAT 


2520 


TGCTCCTTAT 


GAGGTAAAAC 


TGCATATACT 


GTCAGTCTAT TTTATGTTAC 


TGGTGTCCAT 


2580 


TCCAGTTAGG 


CTGGTTCACT 


CTGTGGCCAT 


TCCAAGCAAA ATTTTATGTT 


TGCTTTGTCA 


2640 


CACACTAGAA 


GACAGGGCAT 


CATCTCTTGC 


TTTTGTTTGA GAATGAGGAG 


TACTTTTTTT 


2700 


TTTTTCTGGA 


AAATCTTAAA 


TGGTCCAAAT 


CAGCCATTCC AAATGGCTGA 


TGAAATGTAG 


2760 


CCAATATAGC 


AGTTAGCTCT 


CTAAAATTTA 


AGACCCAACA CCCTCGTATT 


TAT TAG T AAA 


2620 


ACAAAAATGA AACATTTGCT 


GTCATTAGAG 


TAGCCTTAAA ATTAAATTTC 


AATACCAGAT 


2880 


TGACTGAGTA AACTATGCAT 


TCAATGTTGT 


TGTGAGAATT GGGGCTAATT 


AGTCAGGATG 


2940 


ATTGGAATTT 


GTGTAGTTTT 


TTATGGTGAG 


TTGCAATATC TATTTAGGAA 


GG TTCAGGAA 


3000 


TAATAAGAAT 


GAC T CAG AAA 


TACTCAATCT 


CCGTGACAAC AGAAAGCAAT 


CTCACCAAAC 


3060 


TCTGAATTTA AACCCCTTTT 


GAAACATGGA 


GTGAGGCTTG GGAAATGTAC 


CTTTTAAAGA 


3120 


CTTTCCTATC 


TATAAGACAC 


TGCATGCAGG 


GGCAAGTTTA ATCTCTCATC 


AAGGTGGAAA 


3180 


ATAAGAATAG 


TAGCTCGGAA 


AC TACAAAC T 


TGCTAGTGTA GCTTTCACAT 


GGCATGAGCT 


3240 


CAACTATTGT 


TATTTTCCTC 


TTTATCATCA 


AAGCTCCATT GCTGTAGAAA 


GCAGAGGTGA 


3300 


AGACCCAGTT 


TTCCACCTGA 


CACTTTCCGG 


GCAAGGCATA GACCAAGAAC 


TGTCTACAAA 


3360 


ACCAGGGCAA 


AGCTCTTCAG 


TGAAGCTGTT 


TAATTCACAT GGAGAAACAC 


TTGTTTCCCA 


3420 


CTTTGGGAAA 


GCATGCAACA 


GTGTTCCCCC 


TAGATGTTTT GGAAACATTT 


TGAGTCAAAT 


3480 


ATATTTTTCC 


CAGACTAAAC 


CAGGCTAATG 


AGCTCTACAA TCCTCCTGCA 


CATTTTGGTA 


3540 


AAGGGCTGTC 


ATTGCACAGG 


AGCTCCCATT 


TTTATCTTAA AGTGCAAATG 


GGCTAATACG 


3600 


CCTACGAAAT 


GTAATGTATG 


GGTTTTGCCA 


GAAAATAGTA TATTGTGTAC 


ACGTGTCTGT 


3660 


GTGTGAGTGT 


GAGAGTGTGT 


GTGTGTGTGT 


GTGTGTGTGT GTGTGTGAAA 


TTGCATACTA 


3720 


TGCTGGTTTT 


GTTTGTTACT 


CTTTCTCTTG 


GGGATAGTTG GGTTTTCCAG 


AACCACAGAC 


3780 


GAAACTTTTT 


TTTGTTGCTG 


TTTTTATATT 


TTTGCAGAAA CACCATTTAG 


TGAGAATTCA 


3840 


ATGTCAAATT 


AGACATGACA 


CCTTAATTGT 


AAGAAGGGGG GAGAGGGAAA 


GTTGGTTTTT 


3900 


TTTAA7TTTT 


TAAAATTTTG 


TATACTAAAG 


AGAATGAGTC CTTAATTTCA 


, ACATTCTGTT 


3960 


GCATTTAAAT 


AATGATAAGC 


ATCATTAACT 


TCTGTAACAA CTTCCCAGCT 


TGGCAAATTC 


4020 


AATGCATGGA 


GAACAAAGCT 


GGGCCTTAGC 


CATGTTAGGG AGAAAAATGG 


; CTTCTTGGGG 


4080 
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4440 
4500 



4620 
4680 
4708 



GTTGTGAGCA TTTGGGTTGC TTTAGCACCG TTGAGGTGGC ACAGGGGACT CCTGAGGCAT 414 0 
TTCAGCACTA CTTACGTAGC ACTAGGGACT CGGAAATTCC TGTACTGTAG CTAATGATTT 4200 
TGGCGTTCAC CATTAGCAGT AGATAGGCCG TTTCTCTCCT CACACCAGTG TTAAGCGTGT 42 60 
GAGTAGCCAG AGCTGTGGGG AAGAGCATGG AGAACAGACG TCTGCTGGAT GCCTCTCACC 4320 
GGAGAATGAG ATTCCTTCGC GTGGTGGTGA AGTAGGATAG GAAGCAGGAG TCTCCTTGTT 4380 
AGTCCAGTTA GCTATTGTTT TCTTGATATT CCCCCCCAAA AC AT TG ACTA TGAGAGATAT 
GTGGGGCTTT TTTATTTTTA TAATTGTACA AAATTAAACA AATATGAAAT GTTTTATATA 
CTTTATTAAT GTTTTTTTTC AAAAGGTACT TTCTTATAGA CATGATCCTT TTTTTACAGG 4 560 
TTCAGTTGCT TGTCCCTTGG TATTTTTGTG TTATGGGCTA TGGTGAGCCT GAGGCAAATC 
TATAAGC CAT TTTTGTTTGC CAGGACATGC AATAAAATTT AAAAATAAAT GAAAATACAC 
TGAAAAAAAA AAAAAAAAAA AAAAAAAA 

(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CKARAKTERISTIKA: 

(A) IANGE: 4846 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANG FORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS 

(xi) SEQUENZBE5CHREIBUNG: SEQ ID NO: 2: 
CGTTGATATC AAAGACAGTT GAAGGAAATG AATTTTGAAA CTTCACGGTG TGCCACCCTA 
CAGTACTGCC CTGACCCTTA CATCCAGCGT TTCGTAGAAA CCCCAGCTCA TTTCTCTTGG 
AAAGAAAGTT ATTACCGATC CACCATGTCC CAGAGCACAC AGACAAATGA ATTCCTCAGT 
CCAGAGGTTT TCCAGCATAT CTGGGATTTT CTGGAACAGC CTATATGTTC AGTTCAGCCC 
ATTGACTTGA ACTTTGTGGA TGAACCATCA GAAGATGGTG CGACAAACAA GAT T GAGA TT 
AGCATGGACT GTATCCGCAT GCAGGACTCG GACCTGAGTG ACCCCATGTG GCCACAGTAC 36C 
ACGAACCTGG GGCTCCTGAA CAGCATGGAC CAGCAGATTC AGAACGGCTC CTCGTCCACC 
AGTCCCTATA ACACAGACCA CGCGCAGAAC AGCGTCACGG CGCCCTCGCC CTACGCACAG 
CCCAGCTCCA CCTTCGATGC TCTCTCTCCA TCACCCGCCA TCCCCTCCAA CACCGACTAC 54 0 

CCAGGCCCGC ACAGTTTCGA CGTGTCCTTC CAGCAGTCGA GCACCGCCAA GTCGGCCACC 600 
TGGACGTATT CCACTGAACT GAAGAAACTC TACTGCCAAA TTGCAAAGAC ATGCCCCATC 660 



60 
120 
180 
240 
300 



420 
4S0 
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CAGATCAAGG 


TGATGACCCC 


ACCTCCTCAG 


GGAGCTGTTA 


TCCGCGCCAT 


GCCTGTCTAC 


720 


AAAAAAGCTG 


AGCACGTCAC 


GGAGGTGGTG 


AAGCGGTGCC 


CCAACCATGA 


GCTGAGCCGT 


780 


GAATTCAACG 


AGGGACAGAT 


TGCCCCTCCT 


AGTCATTTGA 


TTCGAGTAGA 


GGGGAACAGC 


840 


CATGCCCAGT 


ATGTAGAAGA 


TCCCATCACA 


GGAAGACAGA 


GTGTGCTGGT 


ACCTTATGAG 


900 


CCACCCCAGG 


TTGGCACTGA ATTCACGACA 


GTCTTGTACA 


ATTTCATGTG 


TAACAGCAGT 


960 


TGTGTTGGAG 


GGATGAACCG 


CCGTCCAATT 


TTAATCATTG 


TTACTCTGGA 


AACCAGAGAT 


1020 


GGGCAAGTCC 


TGGGCCGACG 


CTGCTTTGAG 


GCCCGGATCT 


GTGCTTGCCC 


AGGAAGAGAC 


1080 


AGGAAGGCGG 


ATGAAGATAG 


CATCAGAAAG 


CAGCAAGTTT 


CGGACAGTAC 


AAAGAACGGT 


1140 


GATGGTACGA 


AGCGCCCGTT 


TCGTCAGAAC 


ACACATGGTA 


TCCAGATGAC 


ATCCATCAAG 


1200 


AAACGAAGAT 


CCCCAGATGA 


TGAACTGTTA 


TACT TACC AG 


TGAGGGGCCG 


TGAGACTTAT 


1260 


GAAATGCTGT 


TGAAGATCAA AGAGTCCCTG 


GAACTCATGC 


AGTACCTTCC 


TCAGCACACA 


1320 


ATTGAAAPGT 


ACAGGCAACA 


GCAACAGCAG 


CAGCACCAGC 


ACTTACTTCA 


GAAACAGACC 


1380 


TPAATAPAGT 


CTCCATCTTC 


ATATGGTAAC 


AGCTCCCCAC 


CTCTGAACAA 


AATGAACAGC 


1440 


A A A P A AG P 


TGCCTTCTGT 


GAGCCAGCTT 


ATCAACCCTC 


AGCAGCGCAA 


CGCCCTCACT 


1500 


ppt a p a a rr A 


TTCCTGATGG 


CATGGGAGCC 


AACATTCCCA 


TGATGGGCAC 


CCACATGCCA 


1560 


ATGG P T G G AG 

AX V3UU 1 OUrtU 


ACATGAATGG 


ACTCAGCCCC 


ACCCAGGCAC 


TCCCTCCCCC 


ACTCTCCATG 


1620 




CCCAGTGCAC 


ACCCCCACCT 


CCGTATCCCA 


CAGATTGCAG 


CATTGTCAGT 


1630 


TTCTTAGCGA 


GGTTGGGCTG 


TTCATCATGT 


CTGGACTATT 


TCACGACCCA 


GGGGCTGACC 


1740 


APPATPTATP 


AGATTGAGCA 


TTACTCCATG 


GATGATCTGG 


CAAGTCTGAA 


AATCCCTGAG 


1800 


PAATTTPGAP 
Unn x l i \»»ua\^ 


ATGCGATCTG 


GAAGGGCATC 


CTGGACCACC 


GGCAGCTCCA CGAATTCTCC 


I8 60 


TCCCCTTCTC 


ATCTCCTGCG 


GACCCCAAGC 


AGTGCCTCTA 


CAGTCAGTGT 


GGGCTCCAGT 


1920 


G A GA P P PG G G 


GTGAGCGTGT 


TATTGATGCT 


GTGCGATTCA 


CCCTCCGCCA 


GACCATCTCT 


1580 


TTCCCACCCC 


GAGATGAGTG 


GAATGACTTC 


AJVCT T TGA PA 


TGGATGCTCG 


CCGCAATAAG 


2040 


CAACAGCGCA 


TCAAAGAGGA 


GGGGGAGTGA 


GCCTCACCAT 


GTGAGCTCTT 


CCTATCCCTC 


2100 


TCCTAACTGC 


CAGCNCCCTA AAAGCACTCC 


TGCTTAATCT 


TCAAAGCCTT 


CTCCCTAGCT 


2160 


CCTCCCCTTC 


CTCTTGTCTG 


ATTTCTTAGG 


GGAAGGAGAA 


GTAAGAGGCT 


ACCTCTTACC 


2220 


TAACATCTGA 


CCTGGCATCT 


AATTCTGATT 


CTGGCTTTAA 


, GCCTTCAAAA 


. CTATAGCTTG 


2280 


CAGAACTGTA 


GCTGCCATGG 


CTAGGTAGAA 


GTGAGCAAAA 


. AAGAGTTGGG 


! TGTCTCCTTA 


2340 


AGCTGCAGAG 


ATTTCTCATT 


GACTTTTATA 


AAGCATGTTC 


: ACCCTTATAG 


J TCTAAGACTA 


2400 
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TATATATAAA TGTATAAATA TACAGTATAG ATTTTGGGTG GGGGGGCATT GAGTATTGTT 24 60 

TAAAATGTAA TTTAAATGAA AGAAGATTGA GTTGCACTTA TTGACCATTT TTTAATTTAC 2520 

TTGTTTTGGA TGGCTTGTCT ATACTCCTTC CCTTAAGGGG TATCATGTAT GGTGATAGGT 2580 

ATCTAGAGCT TAATGCTACA TGTGAGTGAC GATGATGTAC AGATTCTTTC AGTTCTTTGG 2640 

ATTCTAAATA CATGCCACAT CAAACCTTTG AGTAGATCCA TTTCCATTGC TTATTATGTA 27 00 

GGTAAGACTG TAGATATGTA TTCTTTTCTC AGTGTTGGTA TATTTTATAT TACTGACATT 27 60 

TCTTCTAGTG ATGATGGTTC ACGTTGGGGT GATTTAATCC AGTTATAAGA AGAAGTTCAT 2 82 0 

GTCCAAACGT CCTCTTTAGT TTTTGGTTGG GAATGAGGAA AATTCTTAAA AGGCCCATAG 2 880 

CAGCCAGTTC AAAAACACCC GACGTCATGT ATTTGCGCAT ATCAGTAACC CCCTTAAATT 2940 

TAATACCAGA TACCTTATCT TACAATATTG ATTGGGAAAA CATTTGCTGC CATTACAGAG 3000 

GTATTAAAAC TAAATTTCAC TACTAGATTG ACTAACTCAA ATACACATTT GCTACTGTTG 30 60 

TAAGAATTCT GATTGATTTG ATTGGGATGA ATGCCATCTA TCTAGTTCTA ACAGTGAAGT 3120 

TTTACTGTCT ATTAATATTC AGGGTAAATA GGAATCATTC AGAAATGTTG AGTCTGTACT 318 0 

AAACAGTAAG ATATCTCAAT GAACCATAAA TTCAACTTTG TAAAAATCTT TTGAAGCATA 32 4 0 

GATAATATTG TTTGGTAAAT GTTTCTTTTG TTTGGTAAAT GTTTCTTTTA AAGACCCTCC 3300 

TATTCTATAA AACTCTGCAT GTAGAGGCTT GTTTACCTTT CTCTCTCTAA GGTTTACAAT 3360 

AGGAGTGGTG ATTTGAAAAA TATAAAATTA TGAGATTGGT TTTCCTGTGG CATAAATTGC 3420 

ATCACTGTAT CATTTTCTTT TTTAACCGGT AAGAGTTTCA GTTTGTTGGA AAGTAACTGT 34 80 

GAGAACCCAG TTTCCCGTCC ATCTCCCTTA GGGACT AC CC ATAGACATGA AAGGTCCCCA 354 0 

CAGAGCAAGA GATAAGTCTT TCATGGCTGC TGTTGCTTAA AC C AC T T AAA CGAAGAGTTC 3 600 

CCTTGAAACT TTGGGAAAAC ATGTTAATGA CAATATTCCA GATCTTTCAG AAATATAACA 3660 

CATTTTTTTG CATGCATGCA AATGAGCTCT GAAATCTTCC CATGCATTCT GGTCAAGGGC 3720 

TGTCATTGCA CATAAGCTTC CATTTTAATT TTAAAGTGCA AAAGGGC CAG CGTGGCTCTA 3780 

AAAGG TAATG TGTGGATTGC CTCTGAAAAG TGTGTATATA TTTTGTGTGA AATTGCATAC 334C 

TTTGTATTTT GATTATTTTT TTTTTCTTCT TGGGATAGTG GGATTTCCAG AACCACACTT 3900 

GAAACCTTTT TTTATCGTTT TTGTATTTTC ATGAAAATAC CAT T TAG TAA GAATACCACA 396C 

TCAAATAAGA AATAATGCTA CAATTTTAAG AGGGGAGGGA AGGGAAAGTT TTTTTTTATT 4020 

ATTTTTTTAA AATTTTGTAT GTTAAAGAGA ATGAGTCCTT GAT T TCAAAG TTTTGTTGTA 4 08 0 



(C) 2000 Copyright Derwent Information Ltd. 



WO 99/61610 



7 



PCT/DE99/01557 



CTTAAATGGT AATAAGCACT GTAAACTTCT GCAACAAGCA TGCAGCTTTG CAAACCCATT 4140 

AAGGGGAAGA ATGAAAGCTG TTCCTTGGTC CTAGTAAGAA GACAAACTGC TTCCCTTACT 4200 

TTGCTGAGGG TTTGAATAAA CCTAGGACTT CCGAGCTATG TCAGTACTAT TCAGGTAACA 42 60 

CTAGGGCCTT GGAAATTCCT GTACTGTGTC TCATGGATTT GGCACTAGCC AAAGCGAGGC 4320 

ACCCTTACTG GCTTACCTCC TCATGGCAGC CTACTCTCCT TGAGTGTATG AGTAGCCAGG 4 380 

GTAAGGGGTA AAAGGATAGT AAGCATAGAA ACCACTAGAA AGTGGGCTTA ATGGAGTTCT 4 4 40 

TGTGGCCTCA GCTCAATGCA GTTAGCTGAA GAATTGAAAA GTTTTTGTTT GGAGACGTTT 4 500 

ATAAACAGAA ATGGAAAGCA GAGTTTTCAT TAAATCCTTT TACCTTTTTT TTTTCTTGGT 4 560 

AATCCCCTAA AATAACAGTA TGTGGGATAT TGAATGTTAA AGGGATATTT TTTTTCTATT 4 620 

ATTTTTATAA TTGTACAAAA TTAAGCAAAT GTTAAAAGTT TTATATGCTT TATTAATGTT 4 660 

TTCAAAAGGT AT TATA CAT G TGATACATTT TTTAAGCTTC AGTTGCTTGT CTTCTGGTAC 4 7 40 

TTTCTGTTAT GGGCTTTTGG GGAGCCAGAA GCCAATCTAC AATCTCTTTT TGTTTGCCAG 4 800 

GACATGCAAT AAAATTTAAA AAATAAATAA AAACTAATTA AGAAAT 494 6 

(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 660 Aminosauren 
(8) ART: Amincsaure 
(C) S TRANG FORM : Ein2el 
ID) TOPOLOGIE: linear 

(ii) ART DE3 MOLEK0XS : Protein 

Cxi) SEQUENZBESCHREI3UNG: SEQ ID NO: 3: 

Met Asn Phe Glu Thr Ser Arg Cys Ala Thr Leu Gin Tyr Cys Pro Asp 
15 10 15 

Pro Tyr He Gin Arg Phe Val Giu Thr Pro Ala His Phe Ser Trp Lys 
20 25 30 

Glu Ser Tvr Tyr Arc Ser Thr Met Ser Gin Ser Thr Gin Thr Asn Giu 
35 " 40 45 

Phe Leu Ser Pro Glu Val Phe Gin His He Trp Asp Phe Leu Glu Gin 
50 $=> 60 

Pro He Cys Ser Vai Gin Pro He Asp Leu Asn Phe Val Asp Glu Pro 
65 70 75 80 

Ser Glu Aso Glv Aia Thr Asn Lys lie Glu lie Ser Met Asp Cys He 
65 90 95 



(C) 2000 Copyright Derwent Information Ltd. 



WO 99/61610 



8 



PCT/DE99/01557 



Arg Met Gin Asp Ser Asp Leu Ser Asp Pro Met Trp Pro Gin Tyr Thr 
100 105 110 

Asn Leu Gly Leu Leu Asn Ser Met Asp Gin Gin He Gin Asn Gly Ser 
115 120 125 

Ser Ser Thr Ser Pro Tyr Asn Thr Asp His Ala Gin' Asn Ser Val Thr 
130 135 140 

Ala Pro Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Ala Leu Ser 
145 150 155 160 

Pro Ser Pro Ala He Pro Ser Asn Thr Asp Tyr Pro Gly Pro His Ser 
165 170 175 

Phe Asp Val Ser Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp 
180 185 190 

Thr Tyr Ser Thr Glu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr 
195 200 205 

Cys Pro lie Gin He Lys Val Met Thr Pro Pro Pro Gin Gly Ala Val 
210 215 220 

He Arg Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Glu Val 
225 230 235 240 

Val Lys Arg Cys Pro Asn Kis Glu Leu Ser Arg Glu Phe Asn Glu Gly 
245 250 255 

Gin He Ala Pro Pro Ser His Leu He Arg Val Glu Gly Asn Ser His 
260 265 270 

Ala Gin Tyr Val Glu Asp Pro He Thr Gly Arg Gin Ser Val Leu Val 
275 280 265 

Pro Tyr Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr Val Leu Tyr 
290 295 300 

Asn Phe Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro 
305 310 315 320 

He Leu He He Val Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly 
325 330 335 

Arg Arg Cys Phe Glu Ala Arg lie Cys Ala Cys Pro Gly Arg Asp Arg 
340 345 350 

Lys Ala Asp Glu Asp Ser He Arg Lys Gin Gin Val Ser Asp Ser Thr 
355 360 365 

Lys Asn Gly Asp Gly Thr Lys Arg Pro Phe Arg Gin Asr. Thr His Gly 
370 375 330 



He Gin Met Thr Ser He Lys Lys Arg Arg Ser Pro Asp Asp Glu Leu 
365 390 395 400 
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Leu Tyr Leu Pro Val Arg Gly Arg Glu Thr Tyr Glu. Met Leu Leu Lys 
405 410 415 

lie Lys Glu Ser Leu Glu Leu Met Gin Tyr Leu Pro Gin His Thr lie 
420 425 430 

Glu Thr Tyr Arg Gin Gin Gin Gin Gin Gin His Gin His Leu Leu Gin 
435 440 445 

Lys Gin Thr Ser lie Gin Ser Pro Ser Ser Tyr Gly Asn Ser Ser Pro 
450 455 460 

Pro Leu Asn Lys Met Asn Ser Met Asn Lys Leu Pro Ser Val Ser Gin 
465 470 475 480 

Leu lie Asn Pro Gin Gin Arg Asn Ala Leu Thr Pro Thr Thr lie Pro 
485 490 495 

Asp Gly Met Gly Ala Asn He Pro Met Met Gly Thr His Met Pro Met 
500 505 510 

Ala Gly Asp Met Asn Gly Leu Ser Pro Thr Gin Ala Leu Pro Pro Pro 
515 520 525 

Leu Ser Met Pro Ser Thr Ser Gin Cys Thr Pro Pro Pro Pro Tyr Pro 
530 535 540 

Thr Asp Cys Ser He Val Ser Phe Leu Ala Arg Leu Gly Cys Ser Ser 
545 550 555 560 

Cys Leu Asp Tyr Phe Thr Thr Gin Gly Leu Thr Thr He Tyr Gin He 
565 570 575 

Glu Kis Tyr Ser Met Asp Asp Leu Ala Ser Leu Lys He Pro Glu Gin 
580 ' 585 590 

Phe Arg His Ala He Trp Lys Gly He Leu Asp His Arg Gin Leu His 
595 600 605 

Glu Phe Ser Ser Pro Ser His Leu Leu Arg Thr Pro Ser Ser Ala Ser 
610 615 620 

Thr Val Ser Val Gly Ser Ser Glu Thr Arg Gly Glu Arg Val He Asp 
625 630 635 640 

Ala Val Arg Phe Thr Leu Arg Gin Thr He Ser Phe Pro Pro Arg Asp 
645 650 655 

Glu Trp Asn Asp Phe Asn Phe Asp Met Asp Ala Arg Arg Asn Lys Gin 
660 665 670 



Gin Arg He Lys Glu Glu Gly Glu 
675 ' S30 
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